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d'après B. Green et T. Tao 

RÉSUMÉ. Récemment, B. Green et T. Tao ont montré que l'ensem- 
ble des nombres premiers contient des progressions arithmétiques 
de toutes longueurs, répondant ainsi à une question ancienne à 
la formulation particulièrement simple. La démonstration n'utilise 
aucune des méthodes « transcendantes » ni aucun des grands théorèmes 
de la théorie analytique des nombres. Elle est écrite dans un es- 
prit proche de celui de la théorie ergodique, en particulier de celui 
de la preuve par Furstenberg du théorème de Szemerédi, mais elle 
n'utilise aucun théorème provenant de cette théorie. La méthode 
peut ainsi être considérée comme « élémentaire », ce qui ne veut 
pas dire facile. 

On se propose de présenter l'organisation générale de la preuve 
sans développer les calculs. 

Abstract. b. Green and T. Tao have recently proved that the set 
of primes contains arbitrary long arithmetic progressions, answer- 
ing to an old question with a remarkably simple formulation. The 
proof does not use any "transcendental" method and any of the 
deep theorems of analytic number theory. It is written in a spirit 
close to ergodic theory and in particular of Furstenberg's proof of 
Szemerédi's Theorem, but it does not use any resuit of this theory. 
Therefore the method can be considered as elementary, which does 
not mean easy. We entend here to présent the mains ideas of this 
proof. 

1. Introduction 

1.1. Le résultat. Le but de cet exposé est de présenter un travail 
récent et spectaculaire de B. Green et T. Tao oii ils montrent : 

Théorème 1 ([GT]). L'ensemble des nombres premiers contient des 
progressions arithmétiques de toutes longueurs. 



En fait Green et Tao montrent un résultat plus fort : la conclusion du 

théorème reste valable si on remplace l'ensemble des nombres premiers 
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par un sous-ensemble de densité relative positive. De plus, la méthode 
employée permet de déterminer explicitement pour tout k un entier N 
(très grand) tel que l'ensemble des nombres premiers plus petits que N 
contienne une progression arithmétique de longueur k + 1. 

Le théorème 1 répond à une question fort ancienne bien que diffi- 
cile à dater exactement. Très peu de résultats partiels étaient connus 
jusqu'ici ; citons celui de van der Corput [vdC] qui a montré en 1939 
l'existence d'une infinité de progressions de longueur 3 dans les nombres 
premiers. 

En 1923, Hardy et Littlewood [HL] ont proposé une conjecture très 
générale sur la répartition de certaines configurations dans les nombres 
premiers, qui entraînerait une version quantitative précise du théorème 1 
si elle s'avérait exacte. Ce même théorème suivrait aussi d'une résolution 
positive donnée à une conjecture proposée par Erdos et Turan [ET] en 



Conjecture. Tout sous-ensemble E de N* vérifiant > — = -|-oo con- 



tient des progressions arithmétiques de toutes longueurs. 

Cette conjecture reste totalement ouverte et les méthodes de Green 
et Tao ne permettent pas de s'en approcher. Dans une direction voisine, 
Szemerédi a montré en 1975 l'existence de progressions sous l'hypothèse 
plus forte de la densité positive. Rappelons que la densité d'un ensemble 
d'entiers £^ C N est : 



Le théorème de Szemerédi s'énonce : 

Théorème de Szemerédi ([S]). Tout ensemble d'entiers de densité 
positive contient des progressions arithmétiques de toutes longueurs. 

Il peut aussi s'exprimer en termes d'ensembles finis d'entiers : 

Version finie du théorème de Szemerédi. Pour tout entier k >2 
et tout réel ô > il existe un entier N = N{k, ô) tel que tout sous- 
ensemble E de [0, N[ ayant au moins ôN éléments contienne une pro- 
gression arithmétique de longueur A; -|- 1. 

Ce théorème ne peut évidemment pas être utilisé directement puisque 
les nombres premiers ont une densité nulle. Cependant il tient une place 
centrale dans la démonstration. 



1936 : 
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1.2. La méthode. Le travail de Green et Tao comporte deux parties 
très différentes. 

La première partie, qui est la plus longue, contient la démonstration 
d'une extension de la version finie du théorème de Szemerédi (théorème 3) 

Dans ce dernier théorème, la quantité \E\/N > S peut être vue 
comme la moyenne sur [0, N[ de la fonction indicatrice de E. L'idée 
naturelle est de remplacer cette fonction indicatrice par une fonction 
nulle en dehors de l'ensemble des nombres premiers, mais alors cette 
fonction ne peut pas être choisie majorée par 1 sinon sa moyenne de- 
viendrait arbitrairement petite pour N grand. Green et Tao montrent 
un théorème de Szemerédi modifié (théorème 3) qui s'applique à une 
fonction majorée par un « poids pseudo-aléatoire », c'est à dire par 
une fonction de moyenne 1 dont les corrélations sont voisines de celles 
qu'on obtiendrait en tirant au hasard et indépendamment les valeurs 
aux points 0, 1, . . . , iV — 1 (section 2.2). Cette utilisation d'une majo- 
ration fait penser à la méthode du crible. 

La démonstration de ce « théorème de Green- Tao Szemerédi » est 
écrite dans le langage des probabilités. Comme tous les espaces de prob- 
abilité sont finis et munis de la mesure uniforme, on pourrait dire qu'elle 
utilise seulement des arguments de dénombrement. Cette façon de voir 
serait formellement correcte mais trop réductrice. En fait la démarche 
de Green et Tao s'inspire directement de la théorie ergodique, et plus 
précisément de la démonstration ergodique du théorème de Szemerédi 
donnée par Purstenberg ([F], voir aussi [FKO]). Dans les deux cas, 
le cœur de la preuve est un résultat de décomposition (proposition 4) 
consistant à écrire une fonction comme la somme de son espérance con- 
ditionnelle sur une cr-algèbre bien choisie et d'un reste. L'espérance con- 
ditionnelle est « hssée » et dans le cas considéré par Green et Tao elle 
est même uniformément bornée, ce qui permet d'utiliser le théorème 
de Szemerédi classique. Le reste se comporte comme une oscillation 
aléatoire et sa contribution dans les calculs est négligeable. Les ergodi- 
ciens reconnaîtront la façon dont les « facteurs » interviennent dans de 
nombreux problèmes. Pour les autres, nous ajoutons que l'article n'u- 
tilise aucun résultat provenant de la théorie ergodique et que sa lecture 
ne demande aucune connaissance dans ce domaine. 

Cette inspiration ergodique dans une démonstration combinatoire 
est encore plus apparente dans la nouvelle démonstration que T. Tao 
vient de donner du théorème de Szemerédi [Tl]. Nous ne pensons pas 
que cette démarche soit artificielle. Jusqu'à présent les relations entre 
ces domaines se résumaient pratiquement au principe de correspon- 
dance de Purstenberg qui permet de montrer, à partir de théorèmes 
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ergodiques, des résultats combinatoires dont beaucoup n'ont aujour- 
d'hui pas d'autre preuve. Il apparaît depuis peu des ressemblances de 
plus en plus prononcées quoiqu'encore mal comprises entre les objets 
et les méthodes des deux théories. Nous reviendrons dans ces notes sur 
ce point qui mérite sans doute d'être approfondi. 

Une fois démontré le théorème de Szemerédi modifié, il reste à con- 
struire un poids pseudo- aléatoire adapté au problème posé. Il s'agit 
donc ici de théorie des nombres. Dans cette partie de l'article [GT] 
les auteurs utilisent une fonction de von Mangoldt tronquée et font 
appel à des outils sophistiqués provenant des travaux de Goldston 
et Yildirim [GY] mais, dans une note non publiée [T2], T. Tao ex- 
plique comment l'argument peut être modifié pour n'utiliser que les 
propriétés les plus élémentaires des nombres premiers et de la fonction 
(. C'est cette approche que nous suivons ici en nous inspirant de notes 
manuscrites de J.-C. Yoccoz. 

Dans cet exposé, qui ne contient aucune démonstration complète, 
on se propose de présenter de façon assez détaillée l'organisation de 
la preuve et de donner une idée des méthodes employées à chaque 
étape. Le lecteur pressé pourra se limiter à la section 2 qui contient 
la formulation précise des définitions et résultats correspondant aux 
deux grandes parties auxquelles on vient de faire allusion, encore que 
la définition des normes de Gowers (sous-sections 3.1 et 3.2) ait son 
intérêt propre. Le résultat de décomposition (proposition 4) est énoncé 
dans la sous-section 3.4 et montré dans la section 4. La deuxième partie 
de la preuve, c'est à dire la construction du poids pseudo-aléatoire, est 
contenue dans la section 5. 



1.3. Conventions et notations. Quand / est une fonction définie 

sur un ensemble fini A, V espérance de / sur A, notée K[f[x) \ x & A) 
ou E(/ I A), est la moyenne arithmétique de / sur A; la même est 
utilisée pour les fonctions de plusieurs variables. 

Dans toute la suite. A; > 2 est un entier que nous considérons comme 
une constante. L'objectif est de montrer l'existence d'une progression 
arithmétique de longueur k + 1 dans les nombres premiers. La progres- 
sion est cherchée dans l'intervalle [0, N[, où N est un (grand) entier 
qu'il est souvent nécessaire de supposer premier. On identifie [0, N[ au 
groupe Zjv = Z/NZ. 
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Il est crucial dans la preuve de contrôler la manière dont toutes les 
estimations dépendent de N et nous adoptons les conventions suiv- 
antes. Dans chaque énonce N est supposé fixé mais toutes les con- 
stantes sont indépendantes de A^. Nous notons o(l) une quantité ten- 
dant vers quand tend vers l'infini, uniformément par rapport à tous 
les paramètres sauf éventuellement ceux notés en indice. La notation 
(9(1) est employée avec une signification similaire. 

2. Poids pseudo-aléatoires 

ET THÉORÈME DE GrEEN-TAO SzEMERÉDI 

Green et Tao généralisent une formulation classique du théorème 
de Szemerédi, qui est celle sous laquelle Gowers [G] l'a redémontré 
récemment. 

Théorème 2. Pour tout réel S > il existe un constante c{ô) > tel 
que, pour toute fonction f: Zjv — > M avec 

< f{x) < 1 pour tout X et E(/ \ Z^) > S 

on ait 

(1) E{f{x)f{x + t) ...f{x + kt) \x,t e Zjv) > c{S) . 

La version finie du théorème de Szemerédi se déduit de ce théorème 
en prenant pour / la fonction indicatrice d'un sous-ensemble de [0, A'"[. 
Green et Tao s'affranchissent de la condition / < 1 en la remplaçant 
par l'hypothèse que / est majorée par un poids pseudo- aléatoire ; cette 
notion sera définie plus loin. 

2.1. Les deux ingrédients de la preuve du théorème 1. Nous 
appelons « théorème de Green- Tao Szemerédi » l'extension suivante 
du théorème de Szemerédi : 

Théorème 3. Soit u: Z^v — >■ un poids pseudo-aléatoire (voir la 
sous-section 2.2). Pour tout réel 5 > il existe une constante c'{ô) > 
satisfaisant la propriété suivante. Pour toute fonction f: Zjv — > R telle 
que 

< f{x) < u^x) pour tout X et E(/ | Zjv) > ô 

on a 

(2) E{f{x)f{x + t) ...f{x + kt) \x,t e Zn) > c'{S) - o(l) . 

La démonstration de ce théorème, qui occupe une part importante 
de l'article de Green et Tao, est résumée dans les sections 3 et 4. Pour 
l'appliquer aux nombres premiers, il faut une fonction / et un poids u 
convenables dont l'existence est donnée par le théorème suivant. 
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Théorème 4. // existe une constante positive ô, un poids pseudo- 
aléatoire v: Zjv — > R"*" et une fonction f: Zjv — > K avec 

f est nulle en dehors de l 'ensemble des nombres premiers ; 



La construction de f et v est faite dans la section 5. Nous montrons 
maintenant comment le théorème 1 découle des théorèmes 3 et 4. 

Démonstration. Soient ô, f et u comme dans le théorème 4. Il existe 
un intervalle J C [0, A'"[, de longueur plus petite que N/2 et tel que 
E(lj/ I Zjv) > S/3. Nous utilisons le théorème 3 avec la fonction / 
remplacée par Ijf et le réel S remplacé par 6/3. 

La contribution dans l'espérance (2) des termes oii t = est ma- 
jorée par -/V~^||/||^i^ = o(l), et est donc inférieure à c'{S) si N est 
assez grand. Il existe donc dans ce cas x,t G Zjv avec t ^ tels que 
f{x)f{x + t)...f{x + kt) 7^ 0. Rappelons que dans cette expression 
x,x + t, . . . ,x + kt sont considérés comme des éléments de Zjy et que 
donc l'addition est modulo A^. Si nous considérons x et t comme des 
entiers appartenant à l'intervalle [0, N[ nous obtenons que / est non 
nulle aux points x,x + t mod N, . . . ,x + kt mod N. Comme elle est 
nulle en dehors de l'intervalle J de longueur < N/2, tous ces entiers 
appartiennent à cet intervalle et on en déduit facilement qu'ils forment 
une progression arithmétique non triviale de longueur k + 1. Enfin, / 
est nulle en dehors de l'ensemble des nombres premiers et on a bien 
une progression formée de nombres premiers. □ 

2.2. Définition des poids pseudo-aléatoires. Dans les théorèmes 
précédents nous avons considéré un poids pseudo-aléatoire comme une 
fonction définie sur Zjv. Il s'agit plus précisément de la donnée, pour 
chaque nombre premier N, d'une fonction u = : ^ R+, de sorte 
que soient satisfaites deux conditions asymptotiqucs appelées condition 
sur les formes linéaires et condition sur les corrélations. 

La condition sur les formes linéaires. Ici mo, t et L sont des constantes 
entières (ne dépendant que de k) que nous n'explicitons pas. 
Soient m < mo un entier et ipi, . . . , ip^ des applications de Z^ dans 
Zjv de la forme 



< f{x) < u^x) pour tout x ; 
E(/ I Zjv) > 5 ; 
||/|Uoo=0(l) logTV. 



(3) 
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OÙ X = {xi, . . . ,Xt) et 

- pour tout i, bi est un entier ; 

- pour tous Li j est un entier avec ^ L ] 

- aucun des vecteurs {Li j)i^j^t G n'est nul et ces vecteurs sont 
deux à deux non colinéaires 

alors la condition sur les formes linéaires stipule que 

(4) E(^Vi(x))...i^(V'm(x))|xeZ*v) =1 + 0(1) . 

D'après nos conventions, la quantité o(l) tend vers quand N tend 
vers l'infini indépendamment du choix des fonctions ipi et en particulier 
du choix des bi, qui ne sont pas supposés bornés. Remarquons que la 
condition des formes linéaires entraîne que la même majoration reste 
valable s'il y a moins de t variables. En particulier, 

E{u I Zn) = l + o(l) . 

La condition des corrélations. Ici encore, Qq est une constante entière 
que nous n'explicitons pas. 

La condition sur les corrélations stipule qu'il existe une fonction r : Z^v - 
avec 

pour tout p > 1, E{rP{x) | x G Zjv) = Op(l) 

telle que, pour tout q < qo et tous hi, . . . ,hg G Zjv, distincts ou con- 
fondus, on ait 

(5) E{iy{x + hi)iy{x + h2) . . .iy{x + hq) \ X e Zn) < ^ T{hi-hj) . 

Nous remarquons que, si u est un poids pseudo-aléatoire, alors (1 -|- 
i/)/2 en est également un. On peut donc sans perte de généralité se 
restreindre au cas oià ^{x) > pour tout x. 

3. Les NORMES de Gowers 

3.1. La définition. Il y a quelques années Gowers a proposé une nou- 
velle preuve du théorème de Szemerédi [G] à base d'analyse harmonique 
et de combinatoire. Dans sa démonstration il a introduit une suite de 
normes sur l'espace C{Zn) des fonctions sur Zn à valeurs réelles et 
les a utilisées pour contrôler les espérances qui apparaissent dans le 
théorème 2. Green et Tao les utilisent également pour contrôler les 
espérances du théorème 3. Nous donnons ici leur définition. 
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Pour / e C(ZAr) on définit par récurrence les quantités , d> 1, 

par 



ui = I Zn) ; 

/ d \ 1/2'*+^ 

E(||/-/t||2^, l^eZjv) pourd>l 

où ft est la fonction x f{x + t). 

Ces quantités peuvent être aussi données par une formule close. 
Pour (jj — {(Vi, . . . , (Vd) e {0, 1}*^ et t = {ti, . . . , td) G notons 

U? • t = (Jiti + UJ2t2 H h OJdtd ■ 

On a alors 

(6) \\f\\u.= {^[ n /(^ + '-'-t|a;eZ^, teZ^))'^' . 

On vérifie alors facilement que H/Hc/a est la norme £^ de la transformée 
de Fourier de / et que ||/||[;d+i > \\f\\ud pour tout d > 1. De plus on 
obtient : 

Proposition 1 (Inégalité de Cauchy-Schwarz-Gowers). Si f^,, u} G 
{0, 1}*^, sont 2^ fonctions réelles sur on a 

(7) |e( J] /„(a; + u;-t|xeZ^, teZ^)| < J] WLWv^ ■ 



u;e{0,l}'' 

On en déduit : 



u;e{0,l}'* 



Proposition 2. Pour d > 2 l'application f i— > ||/||j/d est une norme 
sur C(Zjv). 

On peut facilement étendre ces définitions au cas des fonctions à 
valeurs complexes. 

3.2. Commentaires. Pour d > 2 la norme || ■ ||j/d est assez difficile à 
interpréter car elle ne peut apparemment pas être exprimée au moyen 
des normes classiques. La définition n'est pas simplifiée par l'usage de 
la transformée de Fourier ; par exemple, la norme || ■ d'une fonction 
est la même que celle de sa transformée de Fourier (à une normalisation 
près) . 

Cette difficulté provient sans doute du fait que ces normes ont un 
aspect non commutatif. En effet, il est clairement possible de définir des 
normes similaires sur l'espace Ck{G) des fonctions continues à support 
compact sur un groupe abélien localement compact G. Mais il est sans 
doute moins évident que la définition de la norme || • ||[/d s'étend au cas 
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OÙ G est localement compact nilpotent d'ordre d — 1, et qu'elle peut 
même être définie sur Ck{G/V) lorsque F est un sous-groupe fermé d'un 
groupe G de ce type. 

D'une manière indépendante, des semi-normes ||| ■ 1^, > 1, ont 
récemment été introduites [HK] en théorie ergodique dans l'étude de 
questions relatives au théorème de Szemerédi oià elles servent également 
à contrôler des espérances ressemblant à celles du théorème 2. La 
définition de ces semi-normes, nettement plus compliquée, ne sera pas 
donnée ici mais elle est formellement assez similaire à celle des normes 
de Gowers. Ces semi-normes ont une interprétation simple : elles sont 
liées à l'existence de quotients du système munis d'une structure d'es- 
pace homogène d'un groupe de Lie nilpotent. 

Si on admet que les ressemblances de plus en plus nombreuses qui 
apparaissent entre les deux théories ne sont pas fortuites, il est alors 
possible de conjecturer que les normes de Gowers s'interprètent au 
moyen d'une sorte de transformée de Fourier nilpotente, même lorsque 
le groupe est abélien. 

3.3. Normes de Gowers et progressions arithmétiques. La propo- 
sition suivante généralise un résultat analogue de Gowers établi sous 
l'hypothèse plus forte que toutes les fonctions sont bornées par 1. 
Sa démonstration consiste en une suite ingénieuse d'applications de 
l'inégalité de Cauchy-Schwarz, de changements de variables et de la 
condition sur les formes linéaires. 

Proposition 3. Soient u un poids pseudo-aléatoire et fo, fi, ■ ■ ■ , fk des 

fonctions sur 'Lp^' vérifiant 

< 1 + ^{x) pour tout X e Zjv et tout j avec < j < k . 

Alors 



L'utihsation que font Green et Tao de cette proposition est très 
différente de la manière dont Gowers utilise le résultat analogue pour 
les fonctions bornées. 

Ce dernier procède par dichotomie. 
Soient / une fonction sur Zjv et c = E(/ | Z^r). Si ||/ — c\\ifk est 
petit, alors l'espérance (1) est peu différente de l'espérance obtenue 
en remplaçant / par c et elle est donc grande. Si au contraire cette 
norme est grande, alors Gowers montre que la restriction de / à un 
sous-ensemble pas trop petit de Zjv présente des régularités qui sont 
ensuite exploitées. 



k 




j=0 
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Green et Tao utilisent une décomposition, où les normes de Gow- 
ers jouent un rôle très proche de celui joué par les semi- normes ||| • 1^ 
dans [HK]. Lorsque / est une fonction majorée par un poids pseudo- 
aléatoire, elle peut s'écrire (essentiellement) comme la somme d'une 
fonction ayant une petite norme et d'une fonction bornée qui est son 
espérance conditionnelle sur une cr-algèbre (proposition 4). La proposi- 
tion 3 permet alors de borner la contribution provenant de la fonction 
de petite norme. En théorie ergodique on écrit chaque fonction comme 
somme de son espérance conditionnelle sur une cr-algèbre adaptée et 
d'une fonction de semi-norme nulle. On utilise ensuite le fait que cette 
(T-algèbre a une interprétation « géométrique » assez simple. 

3.4. cr-algèbres sur Zjv et un résultat de décomposition. Zjv 

étant fini, toute cr-algèbre B sur est définie par une partition de 
cet ensemble : les éléments de B sont les réunions d'atomes de cette 
partition et les fonctions i3-mcsurables sont les fonctions constantes 
sur chaque atome. Quand / est une fonction sur son espérance 
conditionnelle par rapport à B est la fonction i3-mesurable définie par 



si A est l'atome de B contenant x, 

E(1a/ I Zn) 
E{1a\Zn) 

La proposition suivante est la clé de la démonstration du théorème 3. 



E{f\B){x)=E{f\A) 



Proposition 4. Soit v un poids pseudo-aléatoire. Pour tout e > il 
existe un entier No{e) tel que pour tout N > NQ{e) on ait la propriété 
suivante. 

Soit f une fonction sur avecO < f{x) < u^x) pour tout x. Alors il 
existe une a-algèbre B sur Z^V; un sous-ensemble de Z^v appartenant 
à B avec 

(8) E{u ■ In I Z^) = 0,(1) ; 

(9) 11(1 - 1^,) •E(z/- 1 |-B)||^^ =0,(1) ; 

(10) ||(l-ln)-(/-E(/|S))||^, <6. 

On donne dans la section 4 un résumé de la preuve de cette proposi- 
tion. Admettant ce résultat pour le moment, nous indiquons comment 
on peut en déduire le théorème 3. 

3.5. Démonstration du théorème 3 à partir des propositions 1 

et 4. Soient u, f et S comme dans le théorème. Soient £ > un 
paramètre suffisamment petit et B, comme dans la proposition 4. 
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Nous supposons que A'" est suffisamment grand. Posons 



= (1 - In) ■ E(/ \B)eth=il- In) ■ (/ - E(/ | B)) . 



Comme f < y nous avons 



(11) E(5 I Zjv) > E(/ I Zjv) - E(lf, ■ E(z/ I i3) | Z^) 

= E(/ I Zjv) - E(lî, • I Zjv) > - Oe(l) 
car e B et d'après (8). De plus 



d'après (9). Ainsi, \h\ < f + g < 1 + 1^ + 0^(1) et par ailleurs \\h\\uk < e 
d'après (10). 

Comme < g + h < f, l'espérance (2) apparaissant dans le théorème 
est minorée par la même espérance avec / remplacée par g + h. Cette 
dernière expression s'écrit comme somme de 2'^"'"^ espérances de la forme 



oia chacune des fonctions fi, < i < k, est égale k g ou k h. Ainsi, 
< 1 + + ^^(l) pour tout i. 

Le terme principal est celui oii toutes les fonctions fi sont égales à g ; 
en effet la majoration (12) permet d'utiliser le théorème de Szemerédi 
(théorème 2) et la minoration (11) entraîne donc que ce terme est 
minore par c(5 — 0^(1)). Tous les autres termes ont une valeur absolue 
majorée par 2*'"'"^£ + Oe{l) d'après la proposition 3. 

En choisissant e assez petit nous obtenons donc la minoration an- 
noncée de l'espérance (2), avec c'{S) — c{6). □ 

Remarque. Le résultat obtenu est plus fort que ce qui est réellement 

nécessaire, à savoir c'{S) > 0. Il serait sans doute possible de modifier 
la démonstration en affaiblissant les conditions imposées à u tout en 
conservant la propriété annoncée. 



Cette section est la plus technique de ces notes et les lecteurs qui ne 
seraient pas intéressés par les détails sont invités à passer directement 
à la suivante. 

4.1. Les fonctions duales. Soit / une fonction réelle sur Zjv- Pour 
X e Zjv définissons 



(12) 



0<^< (l-lfî)-E(i/|B) < 1 + 0,(1) 



(13) 




4. DÉMONSTRATION DE LA PROPOSITION 3.4 




we{o,i}* 
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OÙ représente l'élément (0,0,..., 0) de {0, l}'^. Vf est appelée la 
fonction duale (d'ordre k) de /. 

Écrivons (■, ■) le produit scalaire sur C{Zn) donné par (/, g) = ^{fg \ 
Ztv). La définition des normes et l'inégalité de Cauchy-Schwarz-Gowers 
entraînent immédiatement : 

Lemme 1. Pour toute fonction f G C(Zjv), 

11/11^. = (/,!?/) = snp[\{f,Vg)\ ; g G C(Zjv), ||^?||^. < l} . 

Ainsi, la boule unité pour la norme duale de || ■ \\^k est l'enveloppe 
convexe de l'ensemble {Vf ; ||/||i7fc < 1}. Cette norme duale n'est 
malheureusement pas une norme d'algèbre (la norme d'un produit n'est 
pas majorée par le produit des normes), ce qui simplifierait beaucoup 
la démonstration. Dans sa preuve du théorème de Szemerédi [Tl], Tao 
construit une norme d'algèbre qui est majorée par la norme duale. 
Cette construction est formellement très proche de la construction de 
la « tour d'extensions isométriques » de Furstenberg. 

Pour comprendre le rôle joué par les fonctions duales, imaginons la 
situation où nous avons imc fonction / telle que ||/||(/* soit « grande » 
et que HP/ 11^2 ne soit pas « trop grande ». Supposons aussi que nous 
savons construire une cr-algèbre B par rapport à laquelle Vf est mesurable 
au moins approximativement. Alors, comme le produit scalaire de / et 
Vf est grand, l'espérance E(/ | B) aura une norme assez grande. 
Cette méthode est utilisée de manière itérative dans les sous-sections 
suivantes pour construire la cx-algèbre de la proposition 4. 

4.2. Poids pseudo-aléatoires et fonctions duales. Dans toute la 

suite de cette section, u désigne un poids pseudo-aléatoire et nous 
étudions les propriétés des fonctions duales des fonctions majorées par 
u ou par 

Rappelons que la condition sur les formes linéaires entraîne que E(i/ | 
Ziv) = l-|-o(l). On a plus précisément 

(14) \\v-l\\uu^o{l) . 

Nous obtenons de même : 

Lemme 2. Si f est une fonction sur Zn vérifiant \ f\ < 1 + v alors 
\\Vf\\:^^<2^'-^ + o{l). 

Nous notons désormais / un intervalle fermé borné de M tel que 
Vf{x) G / pour tout X et toute fonction / avec |/| < 1 + u. 
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Proposition 5. Soient m > 1 un entier et fi, . . . , fm des fonctions sur 
'Zjsf vérifiant < 1 + u pour tout i, et soit $ une fonction continue 
sur le cube Alors la fonction ip sur Zjv définie par 

^{x)^^Vf^{x),...,Vf^{x)) 

satisfait la relation 

{u - 1,^) = o^,$(l) . 

De plus, cette estimation est uniforme en $ si l'on impose à cette fonc- 
tion de rester dans un compact au sens de la convergence uniforme. 

Pour montrer cette proposition on se ramène facilement au cas où 
^{xi, X2, . ■ . , Xm) = X1X2 ... a;^ et on utilise la condition des corrélations. 
C'est le seul endroit de la preuve oii cette condition est utilisée. 

4.3. Construction d'une a-algèbre. Nous introduisons ici une cons- 
truction qui sera utilisée de manière répétée dans la section suivante 
pour montrer la proposition 4. Ici £ > est un paramètre et a e]0, l/2[ 
est un paramètre accessoire qui devra être choisi soigneusement en 
fonction de e. On se donne une fonction continue ip-.M. [0,1], à 
support dans [0, 1] et égale à 1 sur [cr, 1 — cr]. Nous supposons toujours 
que N est suffisamment grand. 

Soit / une fonction sur Z^v avec |/| < et notons F — Vf. 

Soient a g]0, 1] et B la cr-algèbre dont les atomes sont les ensembles 
A de la forme 

(15) A = {xeZN; e^''^\n + a)<F{x) <e^'^\n + l + a)} 

on n est un entier tel que cet ensemble ne soit pas vide. Le paramètre a 
est introduit pour éviter les effets de bord : il pourrait en effet arriver 
que les valeurs de la fonction F s'accumulent près des points ne^*'^^ 
mais, pour un choix convenable de a, l'ensemble 

E=[j{xeZN; e^'^\n + a-a) < F{x) < e^'^'in + a + a)} 
vérifie 

(16) E(1e- (l + i/) I Z^) = (7(9(1) . 
Par construction, on a clairement, 

(17) \\F-nF\B)\\^^<e-''^' 

Comme F est bornée (lemme 2), le nombre d'atomes de B est un Oe{\). 

Appelons un atome Aàe B mauvais si E((l -\-v)1a \ Z^v) < a^^"^ et 
notons la réunion des mauvais atomes. Alors G S et 

(18) E((l + i/)l^|Z^) =(7^2 0^(1). 
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Soient maintenant A un bon atome, n l'entier correspondant dans la 
définition (15) et J = [£^*^^(n + a, e^''^^{n + 1 + a)[ . Posons ^a{x) — 
ip(^e~^''~^^ {x — n — a)). La proposition 5 permet de majorer $^ o F et 
la propriété (16) permet de contrôler le terme d'erreur 1a — o F — 
(Ij — ^a) ° J^- Nous obtenons 

E{{u{x) - 1)1a{x) \xeA)^ (7^2 0,(1) + o,,,(l) . 

On en déduit que 

(19) ||(1-1^)-E(^-1|B)||^^=0,(1). 

Supposons maintenant qu'au lieu d'une fonction / nous avons une 
famille finie (/i, . . . , /^) de fonctions vérifiant toutes \fi\ < 1 + u. Alors 
par la môme méthode nous pouvons construire une a-algèbre B et un 
ensemble Q & B vérifiant les propriétés (18) et (19) et tels que l'approxi- 
mation uniforme (17) soit valable pour chacune des fonctions Fj = Vf^, 
tous les termes o(l) et 0(1) dépendant aussi du nombre m de fonctions. 

4.4. Une récurrence. Soit maintenant / une fonction avec < / < 
u. Nous allons utiliser la construction précédente de façon répétée, con- 
struisant de proche en proche une suite (fj) de fonctions, une suite (Bj) 
de (T-algèbrcs et une suite (flj) d'ensembles appartenant à Bj. 

Posons /i = / et soient Bi la cr-algèbre grossière {0, Zjy} et Qi = 0. 

Supposons que les constructions ont été faites jusqu'au rang j. Nous 
posons 

= (1 - loj (/ - E(/ I S,)) 

et distinguons deux cas. 

- Si ||/j+i||[/fc < e nous arrêtons l'algorithme; 

- sinon nous employons la méthode précédente avec la famille de 
fonctions (/i, . . . , fj+i) pour définir la a- algèbre Bj^i et l'ensemble 
îlj+i et nous itérons l'algorithme, ce qui est possible car \fj+i\ < 
l + u, k multiplication près par un terme de la forme l + a^^"^ 0^(1). 

Montrons que cet algorithme s'arrête après un nombre borné d'étapes. 
S'il ne s'arrête pas à l'étape j alors ||/j+i||^fc = E(/y+i "D/j+i) > e'^ . 
Imaginons pour simplifier que le petit ensemble Qj est vide. Nous au- 
rions alors fj+i = f — E(/ | Bj) et comme par construction "P/j+i est 
uniformément proche de E(X>/j+i | Bj+i), cette inégalité nous permet- 
trait de minorer 

e((/-E(/|^,))-E(P/,+i|^,+i)) 

e((E(/ I S,+i) -E(/ I B,)) •E(P/,+i I B,^^)) 
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et donc aussi ||1E(/ | Bj^i) — E(/ | Bj)\\L2 en appliquant l'inégalité 
de Cauchy-Schwarz. Les calculs précis permettent en fait de borner 
inférieurement la quantité positive 

11(1 - ln.,J ■ E(/ I - 11(1 - 1^,) ■ E(/ I B,)\\l, . 

Comme ||(1 — Is^^) ■E(/ | -Bj)||i2 est majoré par ||/||l2, cela prouve que 
l'algorithme s'arrête en temps borné. 

La dernière cr-algèbre et le dernier ensemble Q construits vérifient 
alors les propriétés de la proposition 4. □ 



5. Un POIDS PSEUDO- ALÉATOIRE 

Il nous reste à construire une fonction / nulle en dehors des nombres 
premiers et un poids pseudo- aléatoire u vérifiant les hypothèses du 
théorème 3. 

Dans cette section nous notons P l'ensemble des nombres premiers et 
la lettre p désigne toujours un nombre premier. Rappelons la définition 
de deux fonctions classiques. 

- (f) est la fonction indicatrice d'Euler : pour tout entier x > 0, 4>{x) 
est le nombre d'entiers compris entre 1 et x et premiers avec x. 

- n est la fonction de Mobius : 

{1 si X = ; 

(—1)^ si X est le produit de £ nombres premiers distincts ; 
sinon. 



5.1. La fonction / et le poids u. Nous nous donnons une fois pour 
toutes 

- une fonction 1^ — ^ de classe C°°, à support dans [—1,1], 
avec x(0) > et {'x' dx = 1 ; 

- w = w{N) une fonction entière tendant vers l'infini très lentement, 
par exemple de l'ordre de log log N. 

De plus nous notons 

- W = W{N) le produit des nombres premiers < w{N) ; 

- R = A^" 011 a est une constante positive suffisamment petite. 
Soit b un entier qui sera défini plus bas et définissons la fonction / 

sur [0, iV[ par 
(20) 

^ \og{Wn + b) si Wn + b> R et Wn + b est premier 
sinon. 
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Rappelons l'estimation élémentaire de Tcliébytchev pour le nombre 
7r{x) de nombres premiers inférieurs où égaux à x : 

Cir-^ < 7r{x) < C2- 



log X log X 

où Cl et C2 sont des constantes positives. On en déduit (sans utiliser le 
théorème de Dirichlet) qu'on peut choisir 6 G premier avec W 

et tel que pour assez grand on ait E(/(n) | n G [0, N[) > S, où 6 > 

est une constante. 

Pour tout n entier nous posons 

(21) A(n) = ^M<i)x(S 

d\n 



et nous définissons 



(22) iy{n) = log R-X\Wn + b) . 

On vérifie facilement que pour tout ne [0, N[oii a. < f{n) < cv{n) 
pour une certaine constante positive c. Ainsi la fonction / vérifie (à une 
normalisation près) les propriétés annoncées dans le théorème 4. 

Il reste à montrer que u est un poids pseudo-aléatoire, c'est à dire que 
cette fonction vérifie la condition sur les formes linéaires et la condition 
sur les corrélations. Nous ne donnons pas ici la preuve de ces propriétés 
et nous contentons de montrer comment obtenir l'estimation 

E(i/ I Zn) = l + o(l) . 

La méthode qui suit n'est sans doute pas la plus simple possible mais 
elle contient les principaux ingrédients utilisés dans la démonstration 

complète et éclaire le rôle joué par le paramètre R et par la fonction 
X- Intuitivement, le rôle du paramètre w est d'éliminer les perturba- 
tions produites par les petits nombres premiers. Soit en effet p E P. 
Les nombres premiers se répartissent dans p — 1 classes de congruence 
modulo p, ce qui cause une irrégularité d'ordre 1/p, non négligeable si 
p est trop petit devant A^. 

5.2. Une réécriture. E(t/ | Z^v) est le produit par C = W~^(l){W)\ogR 
de 



(23) E/^(^)/^(^')x(^) x(|^) E(W(^) I ^ e Z^) 

d,d' ^ ^ 
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OÙ d, d! sont des entiers positifs et 



1 si PPCM(ci, d') divise Wx + b ; 
sinon. 



Nous évaluons '^.{1^4' \ '^n)- À cause des facteurs //(d) et /i(d') nous 
pouvons nous restreindre au cas oii d et d' sont sans carré et écrire 

d = Y[p'^^ ; d' = Y[p'^'^ 

p p 

011 a; = {ujp ; p E P) et uj' — (a;^ ; p E P) sont des suites à valeurs 
dans {0, 1}. Définissons Ep{r]) pour p E P et rj E {0,1} par 

(24) £"^(0) = 1 ; Ep{l) = si p < w et Ep{l) = ^ si p > w . 
Nous avons 

(25) E(l,,,. I Zn) = llEp{m3x{ujp,u;'p)) + 0(1) . 

p 

En effet, s'il existe un premier p avec p < w et ma.x{up, Up) = 1 alors 
{^) — pour tout X puisque p divise W et est premier avec b. Dans 
le cas contraire la proportion des x G Zjy tels que PPCM[d,d') divise 
Wx + 6 est 1/ PPCM((i, d') à un N^'^ 0(1) près. 

Nous comprenons maintenant le rôle de la troncature effectuée par 
la fonction x dans la définition de v : pour tous les d considérés, les 
entiers 1 , . . . , A'" — 1 se répartissent suffisamment uniformément dans 
les classes de congruence modulo d. En effet, la somme (23) contient 
au maximum termes non nuls et la somme des erreurs 0(1) est 
donc de la forme R'^N'~^0{1) ; le produit par C de cette expression est 
un o(l) puisque R est une petite puissance de 

Ainsi, en reportant l'estimation (25) dans (23) et en remplaçant la 
fonction de Mobius par sa définition, nous obtenons 

(26) E(i/ I Zjv) = o(l) 

+^2^^^[ logR logR ) 11^^ ^ ^Ep{max{u;p,u;^)) . 



5.3. Transformée de Fourier. Dans l'article [GT], Green et Tao 
utilisent une troncature brutale de la somme (21) définissant la fonc- 
tion A, comme dans les travaux de Goldston et Yildirim. L'emploi de la 
fonction lisse x permet de se servir de la transformée de Fourier. Nous 
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écrivons 

(27) x{x) = J r(i)e-^(^+**) dt 

où T est une fonction à décroissance rapide. La somme dans la for- 
mule (26) se met alors aisément sous la forme 

(28) / / T{t)T{t') Yl Zp{t, t') dt dt' 
oii, en notant 

1 + , l + it' 

^ — -, ^ et ^ = — 

logi? logi? 



nous avons 



1 si p < w ; 

1 — p''^~^ — p~^~^' + si p > 



En remplaçant les Ep par leurs valeurs (24) nous obtenons 

Zp{t,t'): 

Il vient alors 

n ^Àt. t') = n (1 - - p'""' + p~"~"') 

p p>w 

p>w 

car w tend vers l'infini avec N et donc 

(29) 

11Z,(M) = + + Ul ' ) 

Nous écrivons l'intégrale (28) comme somme de l'intégrale pour t, t' 
appartenant à l'intervalle J = [— (log i?)^/^, (logiî)^/^] et d'un reste qui 
est de la forme C~^o(l) à cause de la décroissance rapide de la fonction 

T. 

Soient maintenant t et t' appartenant à J. 
Comme W est très petit devant (logi?)^/^ nous avons 

p<w p<w 
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D'autre part, l'estimation élémentaire 

({1 + s) ~ - quand s — > avec Re(s) > 

S 

nous donne 

«1 + '^ + ^'' ;i+o(i))^ = (1+0(1)) ' (1 + + 



C(l + ^)C(l + -2') ^^^z + z' ^ ^ ^Mogi? 2 + it + it' 

En reportant ces valeurs dans (29) nous obtenons 

JLn ^.c. = (1+0(1)) ll^rmt') ^^1^ * 

Comme r est à décroissance rapide, l'intégrale de la deuxième fonction 
en dehors de J x J est de un o(l) et nous obtenons 



//: 



llz,{t,t')^C-Hl + o{l)) Il rmn ^^^l'f^^J^ dtdt'. 



Cette dernière intégrale s'écrit 

/■ + 0O /■ /■ f + OO 

J dsJJ T{t)T{t'){l+it){l+it')e-'^^+''+'''^ dt dt' = J {x'{s)f ds = 1 
et on a donc bien E(i/ | Zjv) = 1 + o(l). □ 
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